Construction de descripteurs pour classer à partir d'exemples bruités
نویسندگان
چکیده
Résumé. En classification supervisée, la présence de bruit sur les valeurs des descripteurs peut avoir des effets désastreux sur la performance des classifieurs et donc sur la pertinence des décisions prises au moyen de ces modèles. Traiter ce problème lorsque le bruit affecte un attribut classe a été très étudié. Il est plus rare de s’intéresser au bruit sur les autres attributs. C’est notre contexte de travail et nous proposons la construction de nouveaux descripteurs robustes lorsque ceux des exemples originaux sont bruités. Les résultats expérimentaux montrent la valeur ajoutée de cette construction par la comparaison des qualités obtenues (e.g., précision) lorsque l’on utilise les méthodes de classification à partir de différentes collections de descripteurs.
منابع مشابه
Construction de descripteurs à partir du coclustering pour la classification supervisée de séries temporelles
Résumé. Nous présentons un processus de construction de descripteurs pour la classification supervisée de séries temporelles. Ce processus est libre de tout paramétrage utilisateur et se décompose en trois étapes : (i) à partir des données originales, nous générons de multiples nouvelles représentations simples ; (ii) sur chacune de ces représentations, nous appliquons un algorithme de cocluste...
متن کاملPanorama de quelques approches récentes pour la classification non supervisée de graphes
Résumé. Les avancées technologiques récentes ont permis d’acquérir dans de nombreux domaines des corpus de graphes. Une problématique en plein essor consiste à classer ces données complexes pour établir des typologies. Différentes approches développées en fouille de données sont présentées dans cet article: la visualisation de graphes dans une perspective exploratoire, la caractérisation des gr...
متن کاملClassification des compte-rendus mammographiques à partir d'une ontologie radiologique en OWL
Résumé. Dans cet article, nous proposons un système de classification des comptes-rendus mammographiques, reposant sur une ontologie radiologique décrivant les signes radiologiques et les différentes classes de la classification ACR des systèmes BIRADS dans le langage OWL. Le système est conçu pour, extraire les faits issus des textes libres de comptes-rendus en étant dirigé par l’ontologie, pu...
متن کاملClassification par voisinages successifs sur des descriptions morphologiques complexes
Résumé. Afin de classifier des descriptions morphologiques issues de bases de connaissances en biologie, nous proposons une méthode de fouille de données incrémentale, interactive et semi-dirigée. Cette méthode est fondée sur la construction itérative du voisinage de la description partielle de l’objet à classer. Nous proposons différents indices de similarité adaptés à la nature complexe des d...
متن کاملConstruction d'attributs pour l'extraction de connaissances à partir de séquences biologiques
Résumé. Dans cet article nous étudions un problème de prétraitement de données : la construction d’attributs décrivant des séquences biologiques. Afin d’assurer l’extraction de connaissances à partir de séquences biologiques (ADN, ARN et protéines), tout système de fouille de données (datamining) se confronte à la représentation non habituelle de ce type de données. Une séquence biologique est ...
متن کامل